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Совмещение зависимых операций на уровне 
обработки разрядов операндов 


На примере операции умножения рассматривается возможность выполнения последовательности зависимых 
по данным операций в режиме совмещения на уровне обработки разрядов машинных слов. Исследован 
метод умножения чисел в неавтономном режиме с использованием смещенной избыточной системы 
счисления, определено влияние на время вычислений величины основания системы счисления и ДЛИНЫ 
последовательности зависимых операций. 


Введение 


Уменьшение времени реализации функциональных зависимостей может быть 
достигнуто за счет распараллеливания вычислений с использованием нескольких опера- 
ционных устройств (ОУ). Традиционные методы параллельной арифметики позволяют 
выполнять указанное распараллеливание только на уровне обработки машинных слов, 
когда перед выполнением каждой операции операнды в ОУ представлены всеми раз- 
рядами. Однако в ряде случаев, например, при реализации итерационных процессов, вы- 
числении многоместных выражений путем суперпозиции функций с меньшим числом 
аргументов возникает необходимость выполнения последовательностей операций зави- 
симых по данным. Распараллеливание вычислений на уровне обработки машинных слов 
в данном случае не представляется возможным. Повышение быстродействия вычисли- 
тельных систем при выполнении цепочек зависимых операций может быть достигнуто за 
счет применения методов машинной арифметики, позволяющих выполнять зависимые по 
данным операции в режиме частичного совмещения с использованием избыточных 
систем счисления [1]. Способы построения таких вычислительных систем известны [2]. 
В их состав входят квазипараллельные ОУ, позволяющие совмещать выполнение зави- 
симых операций на уровне обработки разрядов слов следующим образом. 

На каждом шаге в ОУ вводится по одному разряду операндов (в простейшем 
случае) и формируется один разряд результата. При этом разряд промежуточного резуль- 
тата, полученный на 1-м шаге в одном ОУ при выполнении ]-й операции, может быть 
использован на (1+1)-м шаге в другом ОУ при выполнении (}+1)-й операции. При таком 
режиме вычислений выполнение последующей операции будет начинаться не после 
завершения выполнения предыдущей операции, а сразу же после получения первого 
разряда результата этой операции. Режим работы таких ОУ называют неавтономным, так 
как для выполнения последовательности операций необходимо несколько ОУ, которые 
синхронно обмениваются информацией в процессе работы. 

Методы неавтономной арифметики достаточно хорошо изучены в симметричных 
избыточных системах счисления, которые позволяют реализовать любые функции, как с 
положительными, так и с отрицательными частными производными [1], [2]. В общем 
случае построение квазипараллельных ОУ требует болыших аппаратурных затрат по 
сравнению с параллельными ОУ, в которых не применяются методы ускорения операций 
второго порядка. Однако на практике широко применяются вычислительные методы, 
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основанные на реализации функций с положительными частными производными. Это 
имеет место, например, при реализации методов численного интегрирования, цифровой 
обработки сигналов, вычислении полиномов. В случае положительных аргументов вы- 
числения могут производиться в смещенных системах счисления, что позволяет 
упростить квазипараллельные ОУ. 

Ниже рассматривается операция умножения в смещенных системах счисления 
с различными основаниями, исследуется влияние величины основания системы 
счисления на сложность ОУ и время выполнения последовательностей операций, 
зависимых по данным. 


Обоснование метода умножения 


Функция 7” = ХУ, где аргументы Х и У являются положительными числами, 


имеет только положительные частные производные. Следовательно, положительные 
приращения аргументов вызывают только положительное приращение функции. 
Благодаря этому умножение положительных чисел при поразрядном вводе операн- 
дов можно реализовать в смещенной системе счисления. 

Пусть множимое Х и множитель У являются положительными правильными 
дробями, представленными и-разрядным кодом в позиционной системе счисления с 
основанием („, то есть 


х=УлАт, У=У Е", (1) 
15 = 


где ху, Е {0,4} — цифры операндов. 

Для упрощения индексации при написании формул будем рассматривать метод 
получения произведения 7 = А ”ХУ, зная при этом, что код произведения 7” = ХУ 
может быть получен из кода произведения Г смещением запятой на р разрядов 


вправо. Иными словами, цифры произведения /” формируются с запаздыванием на 
К шагов. Естественно, что для получения и разрядов после запятой произведения 7” 
необходимо сформировать т = п + р разрядов произведения 7. 

Код 1 ‚ представленный т разрядами, имеет вид 


т 


я Ук у 
1 


Где 2, Е {0,4} — цифры произведения 7. 
Будем считать, что операнды вводятся со старших разрядов. Коды Х,У и 1 ‚ содер- 
жащие только 71 разрядов справа от запятой, обозначим соответственно через Х,, У, и 7,. 
После выполнения 7и шагов умножения можно получить код /„ = с погреш- 
ностью, не превышающей А”, если на каждом 1-м шаге цифру 2, выбирать таким 
образом, чтобы выполнялось условие 
-Р — 
ТАЛИИ. (2) 
поскольку при 1 =т имеет место Х„=Хи 7, ЕУ. 
Введя обозначение 
— (1-]Р 7 
В = ХР, К, (3) 
условие (2) можно записать так: 
0< К <1. (4) 
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Предположим, что условие (4) выполняется на (1—1) -м шаге, и определим, при каком 
минимальном значении р это условие будет выполняться на любом последующем шаге. 
Выражение (3) с учетом формул (2) и (1) можно привести к виду 

= -Р -Р 
К, = ЕК, +Е РХ у, + РУХ, 2, 
или, введя обозначение 


Н, = + Ху +Е РУХ, (5) 
представить в форме 
® =Н,-2.. (6) 
С учетом (6) выражение (4) можно записать в виде 
о (7) 
Так как 21, =О и 2, „‚ =4, то условие (7) будет выполняться в том случае, если 


значения Н, не будут выходить за пределы интервала [0,4 +1). Если Н, принадлежит 


интервалу [0,4 +1), то всегда можно подобрать значение 2, {0,4} ‚ при котором 


условие (7) будет выполняться, что вполне очевидно. Поскольку все члены, входящие в 
правую часть (5), могут принимать либо нулевое, либо некоторое положительное 
значение, то Н, не может быть отрицательным числом. Следовательно, р надо 


определять из условия Н,‚„ < 4-1, которое с учетом (4) и (5), а также того факта, что 


тах 
операнды по величине меныше единицы, принимает вид А +24 ” <4+1. Поскольку 
р должно быть целым числом, то минимальное его значение определяется так: 


о 
р= юз, |. (8) 


Так как перед началом умножения, когда Х, =Я =А, =Й, =0, условие (4) 
выполняется, то оно будет выполняться на любом шаге, если р выбрано из условия (8). 
Подставляя в (7) все возможные значения 2, е {0,4} , получим правило выбора 
цифры произведения на #-м шаге: 
2 =еН,, В, =те&Н,. (9) 
Таким образом, один шаг умножения сводится к следующему. По формуле (5) нахо- 
дится значение Н,, в соответствии с (9) формируется цифра произведения и значение К,. 


Начальными являются значения 1=1, Ху =И = А =Й, =0. Все указанные процессы 
можно совмещать во времени, то есть ОУ может быть однотактным. 

Код цифры результата 2, является целой частью кода Н,, то есть разрядами, распо- 
ложенными слева от запятой. Для формирования 2, в данном случае не требуется допол- 


нительных аппаратурных затрат, что имеет место при использовании симметричных 

систем счисления [1]. Это создает предпосылки для упрощения квазипараллельных ОУ. 
Определим, при каких основаниях может быть реализован рассмотренный метод 

умножения в смещенных системах счисления. Из (8) видно, что 4 должно удовлетворять 


условию 4-—А+1>0, откуда 4 >^-1. Так как 4 -— целое число, то минимальное его 


значение должно быть не меньше основания А системы счисления. Естественно, что все 
системы, отвечающие указанному выше требованию, являются избыточными. 
Таким образом, рассмотренный выше метод умножения может быть реализован в 


любой избыточной смещенной системе счисления с цифрами {0,4} ‚ где а удовлетворяет 
условию 4 > К. Естественно, при любом основании А существует множество таких систем 


счисления. Минимальной избыточностью среди них обладают системы с цифрами {0,^}. 
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Эти системы счисления содержат только на одну цифру больше, чем канонические 
системы. Например, при К =2 и К =10 системы счисления, обладающие минимальной 


избыточностью, содержат соответственно цифры {0,1,2} и {0,10}. 

Выбор системы счисления при заданном основании оказывает влияние как на 
запаздывание при формировании разрядов произведения, выраженное в числе шагов, так 
и на число информационных входов и выходов операционных устройств. Естественно, 
что с увеличением числа возможных цифр в общем случае увеличивается и число линий, 
необходимых для передачи цифр от одного операционного устройства к другому. При 
использовании для представления цифр избыточной системы пространственно-унитар- 
ного кода эта зависимость прямо пропорциональная, а при использовании двоичного 
позиционного кода — логарифмическая. Ясно, что с точки зрения уменьшения числа шин 
для передачи информации следует отдать предпочтение системам счисления с меньшей 
избыточностью, то есть с меньшим числом различных цифр. Однако в общем случае с 
уменьшением 4 возрастает р, что вытекает из (8), а следовательно, увеличивается 


запаздывание при формировании разрядов произведения 7’. Подставляя в (8) 4=А, 
определим, что для систем счисления с минимальной избыточностью р=1 + 02 я 2]. 
Так как рассматриваются системы с натуральным основанием К > 2, то в данном случае 
р =2 независимо от основания системы счисления. С ростом 4 (считаем, что А = соп5! ) 


аргумент логарифмической функции в (8) приближается сверху к 2. Следовательно, 
существуют системы счисления с основанием А > 2, для которых р =1. Очевидно, что 


такие системы должны удовлетворять условию 24 /(4а-—^ +1) < или 
К?’ -К 
а>———. (10) 
К-2 
Например, при К =10 система счисления с минимальной избыточностью, удовлет- 
воряющая условию (10), содержит цифры {0,12}. В общем случае системы счисления с 
минимальной избыточностью, для которых р =1, определяются из условия 
К? -К 
к-2 
Очевидно, что применять системы счисления с большей избыточностью неце- 
лесообразно, так как к уменьшению запаздывания при формировании цифр произве- 
дения это не приводит, а число информационных входов и выходов операционных 


устройств в общем случае возрастает. В связи с этим число систем счисления, 
представляющих практический интерес, значительно уменьшается. 


Оценка времени вычислений 


Определим зависимость цикла получения цифры результата от величины 
основания системы счисления. Для однотактного ОУ длительность цикла опреде- 
ляется временем формирования значения промежуточной переменной Н, и записи 
информации в регистр. С учетом (1) и (5) получим основную формулу, вычисление 
которой определяет длительность цикла в однотактном ОУ, в виде 

г -Р -Р =р= 
Но=АВАНА ХАНТ Е ум, (11) 

Будем считать, что операция выполняется в двоично-кодированной системе 
счисления. В этом случае для построения ОУ можно использовать обычную 
двоичную аппаратуру, в том числе двоичные сумматоры. Наибольший интерес 


представляют системы с основанием 2/( 7 =1,2,3,...), поскольку они наиболее просто 
реализуются на двоичной аппаратуре. 
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Каждое слагаемое в (11), кроме первого, может быть сформировано с помощью 
сдвигателей, число которых равно числу двоичных разрядов в цифрах х,,у,. 


Поскольку максимальное значение цифр х,,у, не превышает 4, то число двоичных 


разрядов для их представления равно 102. 4[. Тогда общее число слагаемых при 
вычислении формулы (11) составляет 
№=1+3]02, 4. 

Для одновременного сложения нескольких чисел можно использовать дерево 
сумматоров без распространения переносов по строкам внутри дерева [3]. Перенос 
распространяется только на последнем ярусе, на котором суммируются два слагаемых. 
Количество ярусов без распространения переносов в дереве, узлы которого имеют 3 


входа и 2 выхода, составляет 105, |. Время распространения переносов на последнем 
2 

ярусе с учетом возможности ускорения распространения переносов можно с приемлемой 

для рассматриваемого случая точностью принять за о. и[си, где тси- задержка 

сигналов одноразрядным сумматором [3]. Время записи кода в регистр будем считать 

равным Зтси . Гогда длительность цикла составляет 


Ти =( 108; М + 02, и[-+З)7си . 
2 
Для сравнения эффективности ОУ при выполнении последовательности не- 
распараллеливаемых операций воспользуемся характеристикой, предложенной в [4]. 
Позицию операции в цепочке операций с задержкой р, формирования старшего раз- 
ряда результата будем называть глубиной операции. Время выполнения операции с 
глубиной [Г определяется формулой 


Г 
Т=|п-1+У (р, +1, |. (12) 
= 


Выразив р, через А в соответствии с (10), можно определить зависимость вре- 


мени вычисления последовательности операций по формуле (12) от величины осно- 
вания системы счисления и длины последовательности операций (рис. 1). 


Т(2) иы 
3,5 
3 —— к 
25 —=— К=8 
. ——К=16 
15 


123456789 1011 12 13 14 15" 


Рисунок 1 — Зависимость отношения Т(2)/Т(^) от длины цепочки операций /, 
при разрядности операндов в двоичном представлении и = 64: Т(2) — длительность 


вычислений для двоичной системы счисления; 
Т(®)- длительность вычислений для системы счисления с основанием А>2 
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Заключение 


Благодаря поразрядной передаче данных между квазипараллельными устройствами 
уменьшается число связей между компонентами системы по сравнению с использованием 
параллельных устройств. Это особенно важно при реализации систем в интегральном 
исполнении (например, на ПЛИС), поскольку уменьшение числа соединений повышает 
надежность систем и более экономично использует ресурсы интегральных схем. 

Число линий связей между устройствами для передачи разрядов операндов с 
увеличением основания системы счисления возрастает по логарифмической зависимости, 
то есть незначительно по сравнению с длиной параллельных кодов (32 — 64 разрядов), с 
которыми оперируют параллельные устройства. 

Применение избыточных смещенных систем счисления с основанием А> 2 позволяет 
уменьшить время выполнения последовательности зависимых по данным операций по 
сравнению с двоичной системой счисления при любой длине последовательности, причем 
выигрыш во времени увеличивается с уменьшением числа операций. Это расширяет 
область эффективного использования квазипараллельных устройств. 
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ТА. Дичка, В.В. Жабйна 

Сумщення залежних операций на р!вн! обробки розрядв операндв 

На приклад! операцй множення розглядаеться можливсть виконання послдовност! залежних за даними 
операщй у режим! сумипення на ривн! обробки розрядв машинних сл. Дослуджено метод множення чисел у 
неавтономному режим! з використанням змицено! надлишково! системи числення, визначений вплив на час 
обчислень величини основи системи числення й довжини послдовност! залежних операш!й. 


Т.А. Русйка, Г.Г. йаБта 

Оерепдеп: Орегайоп$ ОуеЙарршо а{ Фе Геуе о{ Орегапа Р1асе Ргосез$ шо 

Ми@рПсабоп 15 сопз14еге4 аз ап ехатре оЁ фе орропипну ю сату ой{ а зедиепсе оЁ ореганопз дерепде4 оп Фе 
аа шт оуеЙаррше тоде а фе 1еуе! оЁРргосеззте оЁтласН ше \уогА р!асез. Тре тефо4 оби арйсаноп оЁпигабегз 
ш Фе оп-Ппе тоде изше $ ед гедипЧап{ пипабег побайоп 15 шуезигаеа, фе шЯчепсе оЁ питбег поайоп Базз 
зе са|1сШайопз ап 1епе® оЁР4ерепдепЕ ореганопз зеаепсе оп #те 15 Чеепитеа. 


Статья поступила в редакцию 10.07.2008. 
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